Az emberi beszéddel a szemantikus tartalmon túl (mondanivaló) sok egyebet is ki lehet fejezni. A hangszínezet, az intonáció (hanglejtés), a ritmusváltozások mind alkalmasak arra, hogy a beszélő akaratlagos vagy éppen spontán érzelmi szándékát, hangulati vagy egészségi állapotát is a közlendő mondanivaló mellett, azzal egyidejűleg kifejezzék. Ezeket nevezik nem verbális eszközöknek, amelyek megvalósítására az emberi hang és beszédképző mechanizmus szintén képes (hangszalag feszítettség változtatása, ritmusváltás, hangerő váltása, zárt artikuláció stb.). A téma során a hallgató feladata olyan gépi tanuló eljárások (beleértve a mélytanulást is) tesztelése, amellyek beszédjel bemenet segítségébel érzelemfelismerést valósítanak meg. Az eljárást akár ember-gépi interfész és ügyfélszolgálati automatizmusokban is fel lehet használni. Bővebb felvilágosításért keressen minket az Informatika épület B 158-as szobájában vagy a sztaho.david@vik.bme.hu, kiss.gabor@vik.bme.hu címek valamelyikén.
Human speech contains much more information then the linguistic content. Non-verbal parts of speech hold information also about the mental state, emotion of the speaker. These clues can be idenftified by human ear, thus artificial intelligence methods can be trained to do so. The task of the student int the topic is to evaluate different machine leaning methods (deep learning included) that are trained with speech samples. The resulting models can be used in fields such as human.machine interfaces and atuomatic services of call centers. For more information, send email to sztaho.david@vik.bme.hu or kiss.gabor@vik.bme.hu